Web Scraping avec n8n | Partie 1 : Créez votre premier Web Scraper

DEV - 17/10

Ce que cela couvrira ! Si vous avez déjà souhaité pouvoir automatiser le scraping sans configurer de...

Ce que cela couvrira !

Si vous avez déjà souhaité pouvoir automatiser le scraping sans configurer un tas de scripts, de proxys ou de logique de navigateur, vous êtes au bon endroit.

Nous utiliserons n8n, l'outil d'automatisation low code, avec l'API Zyte pour récupérer des données structurées depuis https://books.toscrape.com/.

À la fin, vous disposerez d'un flux de travail qui fonctionne de manière autonome, vous donnant une sortie JSON ou CSV propre de tous les livres - leurs noms, prix, notes et images. Et une configuration que vous pouvez facilement adapter à d’autres sites Web accessibles au public ou de test avec des mises en page similaires.

Allons gratter !

Le plan de jeu :

Récupérez la page à l'aide de l'API Zyte (elle gère le rendu et gère automatiquement les blocs)
Extraire le contenu HTML dans n8n
Analyser les éléments du livre avec les sélecteurs CSS
Nettoyer et normaliser les données
Exporter les résultats au format JSON ou CSV

Tout d’abord, préparons n8n à démarrer. Vous pouvez le configurer gratuitement localement ou dans le cloud selon votre préférence. Si vous passez en local, installez-le via Docker ou npm, cela ne prend que quelques commandes.

Une fois que c'est terminé, les étapes ci-dessous fon...
[Courte citation de 8% de l'article original]

Tags : programmation - webscraping - ai - python - logiciel - codage - développement - ingénierie - inclusif - communauté -

Article automatiquement traduit - Source et Copyright images et textes : - DEV
Lien vers la traduction, consulter la traduction de l'article sur Google Translate : https://translate.google.com/translate?hl=en&sl=auto&tl=fr&u=https://dev.to/extractdata/web-scraping-with-n8n-part-1-build-your-first-web-scraper-37cf
Lien original, consulter l'article dans son intégralité ici : https://dev.to/extractdata/web-scraping-with-n8n-part-1-build-your-first-web-scraper-37cf
Lien direct sur notre site : http://newsexplorer.fr/article/29236157/Web-Scraping-avec-n8n-|-Partie-1%C2%A0--Cr%C3%A9ez-votre-premier-Web-Scraper
Partager : Facebook - Twitter

Avis de non-responsabilité pour les articles et les traductions :
Les articles publiés sur ce site ont été rédigés par des auteurs externes et ne représentent pas l'avis ou les opinions de ce site. Les informations contenues dans ces articles sont fournies à titre indicatif et ne doivent pas être considérées comme des conseils professionnels ou juridiques.
De plus, les traductions proposées sur ce site peuvent ne pas être exactes ou complètes. Nous ne pouvons garantir l'exactitude, la fiabilité ou la pertinence de ces traductions et nous déclinons toute responsabilité pour toute perte ou préjudice causé par leur utilisation.
Nous recommandons à nos lecteurs de vérifier toutes les informations avant de prendre des décisions ou d'entreprendre des actions en se basant sur ces articles ou traductions. Nous ne serons pas tenus responsables des erreurs ou des omissions dans les informations fournies sur ce site.